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利用 PSO-SA 混合 优化 支持 向 量 回归 的 径流 预报 模型 研究 
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摘 要: 为 了 有 效 提高 径流 预报 的 准确 度 ， 提 出 一 种 有 效 的 融合 优化 策略 ， 采 用 基于 粒子 群 和 模拟 退火 算法 相 结 合 的 


混合 


品 


提出 


方法 同时 优化 支持 向 量 回归 核 函 数 类 型 和 内 核 参数 ， 以 此 建立 一 种 有 效 的 混合 优化 支持 向 量 回归 径流 预报 模型 。 
的 方法 为 核 函 数 选择 和 参数 优化 提供 了 一 种 有 效 途 径 。 通 过 对 广西 柳州 柳江 径流 实例 分 析 ， 并 与 纯粹 的 支持 向 量 


回归 模型 对 比 ， 研 究 结果 表明 ， 该 模型 预测 稳定 ， 具 有 较 高 泛 化 性 能 和 预测 准确 度 ， 为 径流 预报 提供 了 一 种 有 效 预测 


方法 


o 
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Runoff forecasting based on hybrid optimized support vector regression using PSO-SA 


Jiang Linlil, Li Jie!, Wu Jiansheng™? 


(1. Dept of Mathematics & Computer Science Guangxi Science & Technology Teachers College, Laibin Guangxi 545004, China; 


2. School of Information Engineering, Wuhan University of Technology, Wuhan 430070, China) 


Abstract: In order to effectively improve the accuracy of runoff forecasting, this paper proposed an effective hybrid optimization 


strategy which was based on the combination of particle swarm optimization and simulated annealing algorithm, and it also 


optimized the type of kernel function and the kernel parameter setting of Support Vector Regression to establish an effective 


hybri 


d optimization support vector regression runoff forecasting model. The proposed method provided an effective way for the 


choice of kernel functions and parameter optimization. By analyzing the examples of Guangxi Liujiang’s River runoff and with 


pure 


support Vector regression model comparison, the results of the study show that the model is stable in prediction and it has 


high generalization performance and accuracy of prediction, and it can provide an effective prediction method for runoff forecast. 


Key words: support vector regression; particle swarm optimization; simulated annealing; fusion improvement; runoff forecast 


model 
VV 贡 关 足 ， 如 一 系列 控制 参数 的 获取 ， 难 以 获得 一 个 稳定 的 解决 方案 
加 和 存在 模型 过 拟 合 的 风险 。 
准确 及 时 的 降雨 径流 预报 是 水 资源 管理 一 个 非常 重要 的 课 近年 来 ， 支 持 向 量 机 (support vector machine，SVM) 得 到 不 


题 ， 因 为 有 效 准确 的 降雨 径流 预报 有 助 于 指导 提前 防备 ， 可 以 ”” 断 发 展 ， 这 是 一 种 基于 统计 学 习 理 论 的 学 习 机 ， 坚 持 结 构 风 险 


有 效 避 人 免 娄 


. 


0 生命 安全 、 经 济 损 失 等 的 意外 事故 趾 。 然而 , 由 于 存 。 最 小 化 原则 ， 并 坚持 寻求 最 大 限度 地 减少 所 产生 误差 的 上 限 ， 


在 影响 水 文 的 各 种 非 线 性 因素 外 , 如 降雨 特征 、 流域 形态 、 水 位 ”而 不 是 训练 误差 最 小 化 中 。 随 着 Vapnik 对 不 敏感 损失 函数 的 引 
和 土壤 含水 量 等 ， 一 个 相对 稳固 、 准 确 的 降雨 径流 模型 的 开发 入， 支持 向 量 机 的 


| 


归 模 型 ， 即 支持 向 量 下 


NS 


(support vector 


已经 成 为 了 水 文学 领域 中 一 个 非常 困难 的 课题 四 。 此 外 ， 数 据 ”regression, SVR), 在 解决 非 线 性 估计 问题 上 也 得 到 了 越 来 越 多 
的 缺失 、 品 声 数 据 和 无 效 数据 更 是 加 重 了 降雨 径流 模型 研究 中 ”的 关注 。SVR 成 为 了 解决 大 规模 数据 集 分 类 问题 的 有 力 方法 。 


数据 的 匮乏 由， 模型 构建 面临 更 大 的 挑战 。 上 且 由 于 其 许多 有 吸引 力 的 特点 和 良好 的 泛 化 性 能 ， 在 学 术 界 
神经 网 络 (NNS)GI 能 够 在 潜在 关系 未 知 或 者 难以 描述 的 情 。 和 工业 界 平台 上 已 经 取得 了 很 大 的 成 功 。 

况 下 ， 发 现 数据 之 间 微 妙 的 函数 关系 ， 已 经 成 为 模拟 降雨 径流 然而 ， 使 用 支持 向 量 机 的 回归 时 都 面临 两 个 问题 : 如 何 选 

预报 一 个 非常 有 用 的 方法 向。 然而 ， 神 经 网 络 也 存在 着 一 些 不 择 SVR 的 核 函数 类 型 以 及 如 何 确定 SVR 核 函 数 的 最 佳 参数 ， 
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蓄 烟 沙 这 


函数 的 参数 设 


协同 考虑 。SVR 


两 个 问题 至 关 重 要 。 
We 能 ， 两 者 相互 影响 和 作用 
性 能 高 度 依赖 于 SVR 的 核 函数 类 型 和 


EE 
o 


函数 类 型 影响 支持 向 量 回归 


函数 类 型 和 SVR 核 函 数 的 


参数 可 以 提高 SVR 
拟 合 或 者 低 拟 合 四。 
生 的 效果 很 大 程度 上 
通过 试 凑 获得 最 优 且 有 效 的 参数 ， 然 而 稍 不 小 心 ， 
型 陷入 过 拟 合 ， 这 样 
无 法 预测 未 来 事件 。 

与 此 同时 ， 基 于 徊 
optimization ，PSO) 已 经 被 广泛 地 应 
Kennedy 丁 于 1995 性 


是 


而 不 当 的 SVR 参数 将 会 导致 过 


普通 的 SVR 模型 中 ,支持 向 量 区 


F 提 出 


归 模 型 产 
依赖 于 操作 者 的 经 验 ， 操 作 人 员 依 据 经 验 
便 容 易 使 模 
去 的 事件 ， 但 


的 模型 可 能 会 很 好 地 预测 过 
能 群体 的 粒子 群 优化 算法 (particle swarm 
用 于 优化 核 函 数 参 数 。 
的 粒子 群 优 化 算法 收敛 速度 快 ， 能 不 


断 更 新 粒子 的 位 


题 ， 简 单 的 优化 算法 
化 问题 ， 粒 子 群 
从 而 导致 陷入 


非 线性 优 
收敛 现象 ， 


及 速度 来 搜索 最 优 解 。 


对 一 些 相 对 简单 的 问 


便 可 


以 得 到 满意 的 结果 。 但 是 对 于 多 维 的 
天 化 算法 在 优化 过 程 中 容易 出 现 局 部 
局 部 最 优 解 。 为 了 使 粒子 群 算法 避免 


局 部 最 优 解 ， 厂 
PSO 算法 优化 模型 


PSO 算 
近年 


对 SVR 核 函 


究 人 员 提 出 了 各 种 方法 弥补 PSO 缺陷 ， 改 进 


型 。 


吴 建 生 等 提 
化 算法 在 局 部 搜索 过 程 中 的 收敛 停滞 现象 后 。 

(Simulated Annealing, SA ) 是 一 种 良好 可 
小 值 ， 并 能 够 在 全 局 寻 
去 的 缺陷 。 
来 的 一 些 研究 
优化 的 算法 ， 如 遗传 算法 (genetic algorithm，GA)、 
(PSO) 和 免疫 算法 (immune algorithm，IA)U0-I2， 
数 类 型 的 选择 算法 。 


出 使 用 BP 算法 避免 粒子 群 优 
而 模拟 退火 算法 
了 效 避 免 陷 入 局 部 极 


找 最 优 解 的 优化 算法 ， 可 以 有 效 的 弥补 


也 已 经 相继 提出 了 针对 高 斯 核 函 数 参 数 
粒子 群 优化 


得 没有 出 现 针 


为 此 ,本 文 提出 一 种 模拟 退火 和 粒子 群 混合 算法 优化 SVR 


的 核 函数 类 型 及 其 参数 ， 
确定 SVR 模型 适当 的 核 函 
算法 可 以 使 粒子 群 优 


命名 为 SVR-HPSOSA。 该 算法 能 同时 
数 类 型 和 最 优 核 参数 .SVR-HPSOSA 
化 算法 避免 过 早 陷入 局 部 最 优 解 ， 能 够 找 


到 全 局 最 优 解 。 


模型 。 结 果 表 明 ， 


应 用 于 / 
基于 混合 粒子 群 及 模拟 退火 算法 进化 支持 


西柳 州 市 的 柳江 径流 数据 中 ， 建 立 
向 量 回归 的 径流 预报 


SVR-HPSOSA 模型 进行 日 降雨 量 径流 预 


运用 


5 


报 ， 显 示 了 较 高 的 模型 预测 精度 


意 和 泛 化 能 


1 ”支持 向 量 回 归 


1.1 


支持 向 量 机 


口 


jy 


分析 的 主要 思想 是 


支持 向 量 回 归 模 型 


薪 林 利 ， 等 : 


支持 向 量 机 的 目的 是 在 不 敏感 


利用 PSO-SA a 


Eg 


ChinaXi\ 
向 量 回归 


规范 尽 可 能 的 小 根据 文献 [13], 支 持 


N 
f(x,0,0) = 》 ia KC) +b 


i=l 


由 


数 训练 模式 中 保证 


1 量 机 函数 为 


其 中 6% 态 ) 为 核 函 数 。 在 机 器 学 习 理 论 中 ， 有 如 下 四 种 党 


用 的 核 函 数 : 
线性 核 函 数 : KGs,x)) = 到) (3) 
多 项 式 核 函 数 : KGs,xj)=(t+ xj)? (4) 
高 斯 核 (RBF) 函 数 : KG,x,) -coC 世 -中 (5) 
S 曲线 型 核 函 数 : KGs,xj)=tanhle(x7 .xj)+pB] (6) 
1.2 支持 向 量 回 归 参 数 
支持 向 量 回归 方法 是 近年 来 出 现 的 解决 非 线 型 回归 问题 的 
种 高 效 方法 。 设 计 一 个 有 效 的 支持 向 量 回归 模型 ， 需 要 精心 
挑选 支持 向 量 回 归 的 四 个 基本 参数 。 不 同 的 参数 设置 会 对 文 持 
向 量 机 性 能 产生 显著 的 差异 。 这 要 确定 的 四 个 参数 包括 : 
a) 核 函 数 类 型 。 核 函数 用 于 在 输入 空间 和 特征 空间 之 间 构 


造 一 个 非 线性 映射 。 
b) 内 核 参 数 。 包 括 表示 多 
式 核 的 程度 系数 4 ， 表 示 高 斯 核 函 


核 函数 的 参数 和。 


c) 正则 


2 


2.1 


算 技 术 ， 它 已经 被 成 功 4 
仿真 系统 中 的 灵活 性 
ee 


简单 
子 群 优 
基本 思想 是 通 


过 群体 


也 用 
和 有 效 性 ， 


2 MF 


前 已 被 / 


: 假设 (Xi,d)) ,是 给 定 


[TT 


的 训练 数据 


， Xi 是 输入 向 量 ， 


di 是 输出 向 量 ,N 为 数据 的 总 维 


数 。 线 型 下 


a 
山 


其 中 : 2 和 b 
的 非 线性 映射 。 


是 相关 系数 ，H) 是 从 输入 空 


本 函数 定义 如 下 式 : 


f= Op)+Db (1) 


空间 


间 到 高 维特 征 


在 应 用 领 


域 的 不 足 ， 如 由 于 过 
子 群 最 优 解 陷入 局 部 最 小 的 缺点 。 
粒子 群 优化 算法 的 算法 思想 


项 式 核 的 
数 的 带宽 c ， 


洋 截 参数 ! ， 代 表 多 项 


以 及 sigmoid 


化 参数 C ,代表 最 大 限度 地 减少 训练 误差 和 减少 模 
型 复杂 度 的 产生 成 本 。 
d)s- 不 敏感 损失 函数 。 它 等 效 于 在 训练 数据 


HPSOSA 混合 优化 支持 向 量 回归 策略 


粒子 群 优化 算法 
PSO 是 由 Kennedy 和 Eberhart 在 1995 发 明 的 一 种 进化 计 
于 解决 复杂 的 优化 问题 ， 


点 的 近似 精度 。 


于 其 在 


引起 了 研究 者 的 兴趣 。 粒 


食 的 行为 研究 。 粒 子 群 
个 体 之 间 的 协作 和 信息 共享 来 寻找 最 优 


域 。 但 是 近年 的 研究 已 经 指出 了 


优化 算法 的 


PSO 人 实现 并 且 没 有 许多 参数 的 调节 。 
于 函数 优化 、 神 经 网 络 训 
ie 


模糊 系统 控制 


早 收 敛 导 


致 在 搜索 过 


程 中 发 生 粒 


表示 为 矢量 


Vi = ,V2 VN 


值 (fitness value)， 


(已 er ) 和 现在 的 位 置 Xi 。 这 个 可 以 看 


是 : 粒子 i 在 N 维 空间 的 位 置 
Xi=(1,X2,…,XN) ， 飞 行 速度 表示 为 矢量 
) 。 每 个 粒子 都 有 一 个 由 目标 函数 决定 的 适应 

且 知 道 自己 到 目前 为 止 发 现 的 最 好 位 置 
作 是 粒子 自己 的 飞行 经 验 。 


201 wa 和 
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除 此 之 外 ， 每 个 粒子 还 知道 到 目前 为 止 整个 群体 中 所 有 粒子 发 
现 的 最 好 位 置 ( Coev )( Cpest 是 Poesr 中 的 最 好 值 )。 这 是 粒子 同伴 
的 经 验 。 粒 子 就 是 通过 自己 的 经 验 和 同伴 中 最 好 的 经 验 来 决定 


下 一 步 的 运动 。 
PSO 初始 化 为 一 群 随 机 粒子 (随机 解 )。 然 


后 通过 和 欠 代 找到 


最 优 解 。 在 每 一 次 的 迭代 中 ， 粒 子 通过 跟踪 两 


个 “ 极 值 "已 


est » 


G,。 ) 来 更 新 自己 。 找 到 这 两 个 最 优 值 后 ， 标 准 PSO 算法 粒子 


通过 下 面 的 公式 来 更 新 自己 的 速度 和 位 置 。 


V.=@xV+o xrandO)x(Pbest, —x)+c, xrand() 


x, =X,+V 


x(Gbest —xX,) (7) 
(8) 


上 面 两 式 中 i=12,…,M , M 是 该 群体 中 粒子 的 总 数 ; 吧 非 负 ， 
称 为 惯性 因子 ;Vi 是 粒子 的 速度 Pest 和 Goev 如 前 定义 ; 


介 于 (0 之 间 的 随机 数 ; Xi 是 粒子 的 当前 位 置 。 cl 和 c2 是 学 习 


rand () 是 


因子 ， 通 常 取 cl = c2 = 二 2; 在 每 一 维 ， 粒 子 都 有 一 个 最 大 限制 速 
那么 这 一 维 的 速度 


度 Was ， 如 果菜 一 维 的 速度 超过 设 定 的 aax ， 
就 被 限定 为 Vmae (Vax >0) 。 
2.2 ”模拟 退火 算法 

模拟 退火 算法 (SA) 是 一 种 随机 全 局 搜索 


优化 算法 , 它 是 


基于 统计 热力 学 来 模拟 退火 行为 过 程 史 。 可 以 将 退火 过 程 中 系 


统 炉 值 类 比 为 目标 函数 值 F, 来 模拟 这 个 退火 系统 的 算法 。1983 


年 ，Kirkpatrick 等 提出 模拟 退火 算法 ， 并 将 其 应 


于 组 合 优化 


问题 的 求解 。 模 拟 退 火 算法 是 一 种 可 以 有 效 避 免 陷入 局 部 极 小 


并 最 终 趋 于 全 局 最 优 的 串 行 结构 的 优化 算法 。 


算法 遵循 Metropolis 抽样 稳定 准则 , 即 以 概率 接受 新 状态 。 


假设 在 状态 xon 时 ， 系 统 受到 某 种 扰动 而 使 其 状态 变 为 xnew。 
与 此 相对 应 ， 系 统 的 能 量 也 从 E(xod) 变 成 E(xnew)， 系 统 由 状态 


Xold 变 为 状态 xnew 的 接受 概率 p 定义 为 
p=exp[-(E;:E;)/kgT] 


模拟 退火 算法 的 实现 流程 如 图 1 所 示 。 


令 sl=5j, 并 记录 当前 最 优 解 5* 


(9) 


图 1 SA 算法 流程 图 
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2.3 HPSOSA 混合 优化 支持 向 量 回归 参数 

为 了 得 到 全 局 或 者 接近 全 局 的 最 优 解 , 本 文 提出 了 一 种 混 
合 粒 子 群 和 模拟 退火 算法 的 混合 优化 算法 (HPSOSA), 充分 利用 

了 模拟 退火 算法 能 避免 局 部 最 优 解 获得 全 局 最 优 解 及 粒子 群 算 
法 速度 快 容易 执行 的 优势 。HPSOSA 算法 容易 实现 ， 综 合 了 粒 
子 群 和 模拟 退火 算法 两 者 的 优点 。 

一 般 说 来 ， 当 基于 一 个 小 而 且 适 当 的 特征 子 集 选 择 参数 时 ， 
大 多 数 的 研究 人 员 仍 然 遵循 试验 -误差 的 方式 , 首先 ， 基于 不 同 

的 参数 集 构建 几 个 SVR 模型 , 在 验证 集 上 进行 测试 , 从 而 获得 
最 优 参数 。 然 而 ， 这 个 过 程 是 耗 时 的 ， 而 且 需 要 一 些 运 气 。 除 
了 适当 的 核 函 数 类 型 外 , 参数 的 优化 设置 也 可 以 提高 SVR 模型 
的 准确 度 。 而 核 函数 类 型 会 影响 核 参数 ， 为 了 得 到 适当 的 SVR 
核 函数 和 最 优 的 SVR 参数， 两 者 应 同时 考虑 。 

本 文采 用 HPSOSA 算法 同时 优化 核 函数 类 型 和 核 参 数 设 
， 建 立 基于 HPSOSA 优化 的 支持 向 量 机 回归 模型 ， 将 改进 的 
SVR-HPSOSA 模型 应 用 于 中 国 广西 柳州 市 柳江 的 日 降雨 径流 
预报 中 。 

2.4 ”染色体 表 示 

表 1 概 括 出 了 需要 优化 的 各 种 核 函数 类 型 、 有 效 的 核 函数 
参数 以 及 SVR 人 参数。 因此， 将 染色 体 设 计 成 三 部 分 组 成 。 核 函 
数 类 型 (整数 ) ， 内 核 参 数 以 及 SVR 参 数 〈 实 数 ) 。 表 1 显示 

出 了 具有 4 维 染 色 体 的 表示 ， 其 中 4 是 不 同 数据 集 变 化 的 特征 
数 。 染 色 体 00,01,10,11 表 示 核 函数 类 型 ， 这 四 个 值 分 别 表 示 系 
统 将 选择 线性 核 函 数 ， 多 项 式 核 函数 ， 高 斯 核 函 数 和 S 型 核 函 
数 。 染 色 体 名 4552 代表 了 内 核 参数 的 值 ， 染 色 体 Wr3 忆 本 分 
别 代表 了 惩罚 参数 及 不 敏感 损失 函数 的 值 。 

表 1 核 函数 类 型 .参数 及 支持 向 量 回归 参数 表 


核 类 型 核 参数 SVR 参 数 。” 整 型 编码 。 ” 实 型 参数 编码 
线性 核 Y C 8 00 Xi 1;Xi 2,Xi 3 
多 项 式 核 d d C 8 01 Xi,1,Xi,2,Xi,3,Xi,4 
高 斯 核 CG o C 10 Xi1,Xi2,Xi3,Xi4 
S 曲 线形 核 ua B C E 11 Xi,1,Xi,2,Xi,3,Xi,4 


说 明 : y,d,t,C,0,B 和 a 表示 核 函 数 参数 变量 
2.5 ”SVR-HPSOSA 模型 

图 2 说 描述 了 支持 向 量 回归 优化 算法 SVR-HPSOSA 的 过 
程 。 本 文 提出 的 SVR-HPSOSA 算 法 具体 描述 过 程 如 下 : 

a) 粒 子 的 初始 化 及 粒子 群 参数 设置 : 生成 SVR 内 核 类 型 及 
参数 的 初始 粒子 组 合 。 设 = 0 ， 并 随机 初始 化 粒子 群 人 5 
以 及 粒子 群 的 速度 ”，。 

b) 输 入 训练 数据 并 根据 式 子 (11) 计 算 每 个 染色 体 的 适应 


值 。 


9 评估 所 有 粒子 的 适应 价值 ， 通 过 对 适应 值 的 简单 比较 确 
定 Coer 和 er 。 适 应 函数 被 定义 为 对 训练 数据 集 采 用 
MAPE.ossy_alidation 函数 的 5 次 迭代 交叉 验证 ， 表示 如 下 : 


Se 
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Minf = MAPE.yossy— alidation (10) 


Ye ole (11) 


1 
MAPEcyossy_alidation =— x100% 


其 中 : /是 训练 数据 样本 数 ，®i 是 实际 值 ，7 是 预测 值 。 在 
本 研究 中 ，5 次 迭代 交叉 验证 法 提供 了 计算 成 本 和 有 效 参数 估 
计 值 之 间 的 最 佳 折 吏 ， 被 用 于 在 训练 数据 集 上 计算 适应 值 。 对 
每 一 个 粒子 ， 通 过 式 (11) 计 算 他 的 适应 值 。 

qd) 执行 粒子 群 算法 。 根 据 适应 度 评估 结果 更 新 全 局 和 个 体 
平均 训练 变化 精度 为 全 局 值 ， 验 证 精度 为 个 体 最 侍 


值 。 设 
值 。 
k+l 


日 计算 AFzzness= Fitnaesssi )— Fitness(sk) 


， 随 机 选择 一 个 数 
意味 着 适应 度 函 数 增加 ， 新 的 位 置 发 


k+l CA 


生变 化 。 新 位 置 ”%” ”根据 的 如 下 原则 设置 ，” 二 ”， 当 所 
有 粒子 的 速度 都 已 经 确定 ， 转 向 第 人 ) 步 ， 否 则 ， 转 向 步 b)， 用 
相同 的 估计 方法 为 尚未 被 接受 的 粒子 生成 新 的 速度 。 在 我 们 研 
究 的 100 个 例子 中 ， 相 同 的 粒子 将 迫使 最 后 的 速度 被 接受 ， 同 
时 考虑 机 器 的 执行 时 间 ， 可 以 防止 进入 无 休止 的 循环 。 对 于 可 
能 的 失败 并 没有 发 生 在 我 们 的 研究 和 模拟 过 程 中 。 

有 通过 简单 的 适应 度 值 比较 ， 更 新 每 个 粒子 的 新 位 置 ， 修 
改 Cber 和 Door 的 值 。 

g) 当 进化 过 程 已 经 达到 一 个 满意 的 状态 (或 者 最 大 回归 数 
已 经 达到 〉， 则 继续 执行 步骤 3， 否 则 ， 调 整 惯性 权重 ， 以 
及 模拟 退火 温度 TH=K*T ， 设 置 k=ktl， 并 返回 到 步 又)。 

h) 输 出 最 好 方案 ber 及 其 适应 度 值 。 取 回 停止 交代 时 的 核 

函数 类 型 及 参数 值 。 

i) 基于 选 出 的 核 函 数 类 型 和 参数 ， 在 更 大 训练 集 上 反复 训 
练 和 构建 支持 向 量 回归 。 最 后 ， 利 用 训练 好 的 SVR 模 型 在 测试 
集 上 进行 测试 。 


U el[0,1] 如 果 AFimess>0， 
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图 2 HPSOSA 优化 SVR 流程 
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3 ”应 用 实例 及 结果 分 析 


实验 采用 改进 的 SVR-HPSOSA 方法 , 运行 环境 配置 : 英 特 
尔 赛 扬 M 1.86 GHz 处 理 器 ， 内 存 1.5 GB，Windows XP 操作 系 
统 和 Matlab 开发 环境 。PSO 参数 设置 如 下 : 和 帮 代 次 数 为 100; 
种 群 数量 为 100; 最 小 惯性 权重 为 0.1， 最 大 惯性 权重 为 0.9， 
学 习 率 为 2。 初始 温度 为 5000; 终止 温度 为 0.9, 温度 降低 系数 
为 0.001。 

3.1 实验 数据 

广西 柳江 属 珠江 水 系 ， 干 流 全 长 773.3 公里 ， 流 域 面积 
57173 平方 公里 , 跨 黔 、 桂 、 湘 三 省 30 个 县 、 市 , 天 然 落 差 1306 
米 ， 平 均 比 降 1.68%。， 年 均 流量 1865 立方 米 / 秒 ， 汛 期 为 4-9 
月 。 到 了 汛期 就 柳江 河 段 而 言 , 洪水 发 生 较为 频繁 ， 从 1988 年 
至 今 的 近 20 年 间 ， 大 洪水 的 发 生 较 为 频繁 , 灾害 也 很 严重 ， 
生 超过 100 年 一 遇 的 特大 洪水 1 次 (“1996.7”) ，20 至 50 恒 
一 遇 的 大 洪水 3 次 (“1988.8”、“1994.6” 和 “2004.7” 洪 水 )， 
10 至 20 年 一 遇 的 较 大 洪水 1 次 (“2000.6” 洪 水 ) 。 为 此 建立 
较为 准确 的 汛期 柳江 径流 预报 模型 ， 对 于 防 灾 减 灾 意 义 十 分 重 
要 。 本 文 建立 模型 的 数据 选取 广西 柳江 老 桥 口 的 每 天 12 时 的 
流速 (m/s ) 数据 进行 应 用 实例 分 析 ， 总 数据 为 2008 年 1 月 
1 日 至 2010 年 9 月 30 日 期 间 共 1004 个 数据 点 。 将 数据 分 为 两 
部 分 , 2008 年 1 月 1 日 到 2010 年 3 月 31 日 期 间 的 821 个 数据 
点 用 于 模型 训练 , 余下 的 183 个 样本 (2010 年 4 月 1 日 到 2010 
FE 9 月 30 日 为 主要 汛期 ) 用 于 模型 测试 。 

3.2 输入 变量 

一 般 来 说 ， 降 雨 -径流 涉及 的 因果 变量 关系 包括 降雨 量 、 降 
雨 前 水 位 、 水 流 蒸 发 、 温 度 等 。 大 多 数 研究 应 用 降雨 量 和 前 期 
流量 《或 水 位 ) 作为 输入 变量 。 根 据 逐 步 回 归 方法 ， 同 时 考虑 
前 期 降雨 量 和 径流 时 间 序 列 ， 更 能 与 Xeoro 相关 ， 因 此 ， 选 择 这 
两 个 最 佳 的 输入 组 合作 为 此 模型 的 输入 。 由 文献 [15], 考虑 将 径 
流 时 间 点 1X4-p)、1-2X0-2))、1-3(XG-3))、1 一 4(X(-4)) 的 值 
及 降雨 量 时 间 点 二 ICRc-D) 的 值 作为 模型 的 输入 ， 通 过 逐步 回归 
方法 消除 低 影响 因子 并 选择 出 最 优 影响 力 的 因子 。 

3.3 SVR-HPSOSA 模型 训练 

使 用 相同 的 预测 因子 ， 对 SVR-HPSOSA 模型 预测 结果 点 
SVR 模型 结果 进行 比较 。 本 研究 进行 了 简单 的 参数 设置 ， 设 置 
高 斯 核 函 数 带 宽 6=0.75， 另 外 两 个 参数 ， 正 则 常数 C 及 损失 函 
数 s 的 选择 基于 试验 -误差 法 。 具 有 测试 最 小 均 方 误差 平方 根 
(RMSE ) 的 参数 被 认为 是 最 优 的 ,得 到 了 基于 最 好 测试 和 预测 


i 


mm 


oy 


宫 


结果 (使 RMSE 最 小 ) 下 的 最 优 参 数 是 (C=8，e=0.07) 。 
3.4 性 能 评价 
在 许多 文献 中 有 很 多 关于 降雨 -径流 预报 模型 性 能 指标 。 


本 文 使 用 以 下 的 评价 指标 来 衡量 该 模型 的 性 能 : 均 方 根 误差 
(RMSE) ， 平 均 绝 对 百分比 误差 (MAPE ) 及 效率 系数 
CCE) 。 此 外 ， 由 于 降雨 径流 模型 峰值 点 非常 重要 ， 本 文 使 
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\= 
/= Wr 


] 式 (12) 来 比较 不 同 模型 在 捕捉 径流 时 间 序 列 的 整个 径流 数 
据 峰 值 的 性 


能 指标 。 


n 
庆生 
Ds —xpi) 


Co re (12) 


n 


tp -xp)? 


i=l 


CEpeok 是 峰值 的 效率 系数 ，Xpi; ，xp; ，x, 和 7 分 别 代表 


观测 值 、 预 测 值 和 观测 平均 值 ， 以 及 观测 到 的 数据 峰值 个 数 。 


性 能 


模型 的 性 


台 
BE 


评价 指标 (RMSE) 和 (MAPE) 主要 是 从 数值 上 评价 
,其 值 越 小 说 明 模型 的 预测 性 能 越 好 ; 性 能 指标 (CE) 


; 
[| 


主要 是 看 模型 能 否 对 径流 的 趋势 做 出 正确 的 判断 ， 其 值 越 大 就 


mm 


说 


月 模 型 能 够 较为 准确 把 握 径流 未 来 趋势 ;性 


东 


| 


能 指标 公式 (12) 


是 洪水 峰值 趋势 的 判断 指标 ， 对 于 径流 模型 在 实际 应 用 中 ， 最 


关心 的 就 是 能 否 较 为 准确 预测 灾害 性 洪水 ， 即 洪水 峰值 达到 时 


刻 和 对 洪水 峰值 趋势 跟踪 ， 本 文 把 流速 大 于 4000 (m/s) 看 


做 是 洪峰 值 ， 其 中 (12) 中 的 用 就 是 在 预测 时 间 区 间 中 大 于 4000 
(m/s) 样本 个 数 。 
结果 分 析 


3.5 


图 3 为 2010 年 4 月 1 日 到 9 月 30 日 ， 对 小 于 4000 的 径流 ， 


SVR-HPSOSA 和 单纯 SVR (高 斯 核 ) 两 种 模型 分 别 得 到 的 预测 


值 与 观测 值 的 比较 。 图 4 是 2010 年 4 月 1 日 到 9 月 30 日 ， 对 大 于 
4000 的 径流 ， 分 别 使 用 单纯 SVR (高 斯 核 ) 和 提出 的 SVR- 
HPSOSA 模 型 得 到 的 预测 峰值 与 观测 峰值 的 比较 。 通 过 两 图 我 
们 可 以 看 到 SVR-HPSOSA 模 型 的 结果 比 SVR 模 型 更 接近 实际 观 
察 到 的 水 位 
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表 2 以 图 表 的 方式 分 别 给 出 了 使 用 纯 SVR 高 斯 核 ) 和 
SVR-HPSOSA 两 种 模型 的 拟 合 精度 、 预 测 精度 和 模型 效率 三 种 
性 能 指标 对 比 。 正 如 表 2 所 示 ， 对 于 训练 数据 ，SVR 模 型 的 均 
方 根 误差 为 167.863; 而 SVR-HPSOSA 模 型 ， 误 差 只 为 74.218。 
同样 ， 对 于 测试 数据 ，SVR 模 型 的 均 方 根 误 差 为 909.564; 而 对 
于 SVR-HPSOSA 模 型 ， 误 差 达到 201.723 。 针 对 训练 和 测试 数 
据 的 MAPE 指 标 ，SVR-HPSOSA 模 型 也 低 于 SVR 模 型 。 这 些 结 
果 表 明 ， 观 察 和 预测 值 之 间 的 偏差 是 非常 小 的 。 此 外 ，SVR- 
HPSOSA 模 型 的 CE 效率 系数 是 所 有 模型 中 最 大 的 。 这 也 意味 着 
SVR-HPSOSA 模 型 能 够 捕获 到 日 径流 的 平均 变化 趋势 。 

实验 结果 表明 ，SVR-HPSOSA 模 型 在 径流 预测 上 是 非常 有 
前 途 的 ， 既 有 良好 的 拟 合 表 现 ， 也 有 有 效 的 预测 表现 。 体 现 了 
SVR-HPSOSA 模 型 训练 和 测试 结果 的 一 致 性 。 从 RMSE、 
MAPE 和 CE 三 个 性 能 指标 的 表现 来 看 ， 对 具有 相同 输入 的 径流 
预测 ，SVR-HPSOSA 模 型 要 优 于 SVR 模 型 。 
与 其 他 模型 相 比 ，SVR-HPSOSA 模 型 对 峰值 预测 能 力 。 峰 
值 估 计 通 常 是 在 实际 降雨 -径流 应 用 中 防洪 减灾 计划 最 重要 参 
考 之 一 ， 被 作为 建 模 过 程 考 查 的 关键 。 从 表 2 可 以 看 出 ，SVR- 
HPSOSA 模 型 对 极端 径流 数据 有 更 好 预测 能 力 ， 大 大 超过 了 
SVR 模 型 。SVR-HPSOSA 模 型 训练 数据 的 “vet 值 为 0.984， 测 
试 数据 是 0.977。 显 示 出 了 对 峰值 数据 较 高 的 处 理 能 力 。 因 此 ， 
本 文 提出 的 模型 适合 用 于 建立 柳江 汛期 径流 SVR 预 测 模 型 ， 而 
且 预 测 精度 高 。 
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小 于 4000 径流 观测 值 与 两 种 模型 预测 结果 比较 
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大 于 4000 径流 观测 值 与 两 种 模型 预测 结果 比较 


从 表 2 可 以 进一步 看 出 ， 径 流 模型 核 函 数 类 型 最 佳 的 选择 

是 Sigmoid 曲 线 核 函数 ， 最 优 的 核 参 数 设 置 为 ，% 等 于 0.325， 

8 为 0.0264，SVR 最 优 的 参数 设置 : C 为 18.60，2 为 0.1059。 
表 2 SVR 和 SVR-HPSOSA 模型 径流 预测 结果 比较 


模拟 数据 (2008 年 1 月 1 日 -2009 年 3 月 31 日 ) 
模型 MAPE RMSE CE CEpeak 
SVR 15.758% 167.863 0.987 0.929 
SVR- 
3.734% 74.218 0.997 0.984 
HPSOSA 
预测 数据 (2010 年 4 月 1 日 -2010 年 年 9 月 30 日 ) 
模型 MAPE RMSE CE CEpeak 
SVR 25.881% 909.564 0.822 0.482 
SVR- 
5.284% 201.723 0.992 0.977 
HPSOSA 
核 函数 类 型 和 参数 
Q B C 8 
Sigmoid 0.325 0.0264 18.60 0.1059 


注 : 拟 合 模型 中 的 径流 峰值 为 48 个 样本 ， 径 流 峰 值 为 21 个 样本 ， 径 流 值 大 


于 4000， 为 峰值 


4 ”结束 语 


降雨 -径流 系统 是 最 活跃 的 动态 气象 系统 之 一 。 本 文 的 优 
势 和 关键 在 于 融合 PSO 和 SA 各 自 的 优势 进化 SVR 核 函数 类 型 及 


录用 稿 
参数 ， 用 以 建立 一 种 径流 预报 模型 SVR-HPSOSA。 在 真实 降雨 


-径流 数据 实验 中 ， 训 练 出 了 SVR 模 型 合适 的 核 函 数 类 型 和 参 
数值 ， 与 纯粹 SVR 模 型 预测 进行 比较 ，SVR-HPSOSA 模 型 预测 
显示 出 了 相对 高 的 精度 。 根 据 本 文 的 研究 结果 ，SVR-HPSOSA 
方法 具有 以 下 的 特点 : 

a) SVR-HPSOSA 算 法 能 避免 局 部 最 优 解 ， 通 过 混合 SA 的 
接受 准则 和 PSO 随 机 接受 原则 ， 减 少 了 局 部 搜索 端点 附近 的 震 
动 偏 离 ， 根 据 新 旧 位 置 之 间 不 同 的 适应 度 值 ， 运 用 规则 接受 新 
位 置 ， 还 是 重新 计算 男 一 个 可 信 位 置 。 这 使 得 模型 可 以 跳出 局 
部 最 优 解 ， 并 减少 局 部 搜索 终点 附近 的 震动 偏离 。 这 些 特性 提 
高 了 解决 方案 的 质量 和 收敛 速度 。 
b) SVR-HPSOSA 算 法 具有 运算 速度 快 和 能 在 全 局 方向 搜 
索 最 优 解 的 优点 ， 通 过 结合 PSO 运 行 机 制 、 并 行 处 理 干扰 机 制 
以 及 SA 解决 搜索 路 径 的 特点 ， 可 以 快速 找到 一 个 好 的 解决 方 


案 。 


bs: 


c) 根据 本 文 的 研究 结果 ， 我 们 可 以 得 出 以 下 结论 S 曲 线 
核 函 数 的 SVR 模 型 可 以 作为 实际 径流 预测 应 用 中 的 一 种 手段 ， 
从 实证 结果 的 角度 看 ， 它 能 得 到 较 好 的 预报 精度 ， 具 有 较 高 的 
预测 质量 。 

d) 采用 Sigmoid 曲 线 核 函数 时 ， 支 持 向 量 机 实现 的 是 
前 向 神经 网 络 ， 但 是 由 于 使 用 SVR 方 法 ， 网 络 隐 含 层 节 点 数 、 
连接 权 值 都 是 在 设计 的 过 程 中 自动 确定 ， 而 且 SVR 的 理论 决定 
了 它 最 终 求 得 的 是 全 局 最 优 值 而 不 是 局 部 最 小 值 ， 也 保证 了 它 
对 于 未 知 样本 的 良好 泛 化 能 力 而 不 会 出 现 过 学 习 现象 ， 以 此 可 
以 解释 Sigmoid 曲 线 核 函 数 的 SVR 模 型 最 为 适宜 径流 预测 模 
型 。 可 以 推广 在 其 它 地 区 的 径流 预测 上 ， 同 样 可 以 被 认为 是 水 


的 是 一 种 


文 研究 系统 管理 中 较 强 的 径流 预测 工具 。 
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